微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍 微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍 关键词: AI新闻,扩散语言模型, WeDLM,WeChat Diffusion Language Model,模型训练 近日,腾讯微信 AI 团队提出了 WeDLM(WeChat Diffusion Language Model),这是首个在工业级推理引擎(vLLM)优化条件下,推理速度超越同等 AR 模型的扩散语言模型。 来自主题: AI技术研报 9252 点击 2026-01-03 13:56